SPSS Friedman 检验教程
By Ruben Geert van den Berg under 非参数检验
为了检验三个或更多变量是否具有相同的总体均值,我们的首选方法是重复测量方差分析 (Repeated Measures ANOVA)。这要求我们的数据满足一些假设,例如正态分布 (Normally Distributed)。如果这些假设不满足,那么我们的第二选择是 Friedman 检验:一种重复测量方差分析的非参数替代方法。严格来说,Friedman 检验可以用于定量或定序变量,但后者的情况可能存在关联问题。
Friedman 检验 - 如何工作?
原始变量在个案内进行排序 (ranked within cases)。
计算平均秩 (mean ranks)。如果原始变量具有相似的分布,那么平均秩应该大致相等。
检验统计量,卡方 (Chi-Square) 类似于平均秩的方差:当平均秩完全相等时,它为 0,并且随着它们的距离变大而变大。在方差分析 (ANOVA) 中,我们发现了一个类似的概念:“组间均方 (mean square between)” 基本上是样本均值之间的方差。这在 方差分析 - 是什么?(ANOVA - What Is It?) 中解释。
渐近显著性 (Asymp. Sig.) 是我们的 p 值 (p-value)。它是如果_总体 (population)_ 分布相等,发现我们的_样本 (sample)_ 差异的概率。我们的样本中的差异有很大的(0.55 或 55%)发生的可能性。它们不与我们总体分布相等的假设相矛盾。
SPSS 中的 Friedman 检验
让我们首先看看我们的数据 adratings.sav,其中一部分如下所示。该数据包含 18 名受访者,他们以百分比(0% 到 100% 的吸引力)等级对 3 个汽车广告进行了评分。
我们想知道哪个广告在总体中表现最佳。因此,我们将首先查看样本中的平均评分是否不同。如果是这样,下一个问题是它们是否差异足够大,以至于可以得出相同的结论适用于我们的大部分总体。也就是说,我们的零假设 (null hypothesis) 是我们的 3 个评分变量的总体分布相同。
快速数据检查
检查我们的评分变量的直方图 (histogram) 将以最小的努力为我们提供对数据的深入了解。我们将通过运行以下语法来创建它们。
*Inspect histograms with normal distributions superimposed.
**
frequencies ad1 to ad3
/format notable
/histogram normal.
结果
最重要的是,我们的数据看起来是合理的:我们没有看到任何离谱的值或模式。请注意,平均评分差异很大:83、55 和 66。每个直方图都基于所有 18 个个案,因此无需担心缺失值 (missing values)。 现在,通过将正态曲线叠加在我们的直方图上,我们确实看到我们的变量并不完全符合重复测量方差分析所需符合正态分布。对于较大的样本量(例如,n > 25 左右),这不是一个严重的问题,但是我们现在只有 18 个案例。因此,我们将采取安全措施,而是使用 Friedman 检验。
在 SPSS 中运行 Friedman 检验
K 个相关样本 (K Related Samples) 意味着我们将比较在同一受访者上测量的 3 个或更多变量。这类似于我们在重复测量方差分析中发现的“受试者内效应 (within-subjects effect)”。
根据您的 SPSS 许可,您可能拥有或可能没有 E xact 按钮。如果您有,请如下填写,否则请跳过它。
SPSS Friedman 检验 - 语法
按照这些步骤操作将导致以下语法(如果您选择了精确统计信息,则将有一行额外的代码)。让我们运行它。
*SPSS Friedman test syntax.
**
NPAR TESTS
/FRIEDMAN=ad1 ad2 ad3
/MISSING LISTWISE.
SPSS Friedman 检验 - 输出
首先请注意,平均秩 (mean ranks) 在很大程度上偏向于第一个(“家用汽车”)广告。毫不奇怪,平均秩的顺序与我们在直方图中看到的平均值相同。 卡方 (Chi-Square)(更正确地称为 Friedman’s Q)是我们的检验统计量。它基本上用一个数字概括了我们的广告的评分差异程度。
df 是与我们的检验统计量相关的自由度 (degrees of freedom)。它等于我们比较的变量数 - 1。在我们的示例中,3 个变量 - 1 = 2 个自由度。
渐近显著性 (Asymp. Sig.) 是近似的 p 值 (p-value)。由于 p < 0.05,我们拒绝总体分布相同的零假设。“Asymp” 是 “asymptotic” 的缩写:我们的样本量越接近无穷大,Friedman’s Q 的抽样分布就越类似于 χ2 分布。相反,对于较小的样本,此 χ2 近似值不太精确。
精确显著性 (Exact Sig.) 是精确的 p 值。如果可用,我们更喜欢它而不是渐近 p 值,尤其是在样本量较小的情况下。如果存在精确的 p 值,那么为什么有人会使用近似的 p 值呢?基本原因是精确的 p 值需要非常繁重的计算,尤其是在样本量较大的情况下。现代计算机可以很好地处理这个问题,但情况并非总是如此。
Friedman 检验 - 报告
如前所述,我们将在报告中包括整个平均秩表。这告诉您哪个广告的评分最高与最差。此外,我们可以写类似“Friedman 检验表明我们的广告的评分不同,χ2 (2) = 8.65, p = 0.013”的内容。我们个人不同意此报告指南。我们认为 Friedman’s Q 应该被称为 “Friedman’s Q” 而不是 “χ2”。后者仅仅是在计算 p 值时可能涉及的近似值。此外,随着样本量的减少,此近似值变得不太准确。Friedman’s Q 绝不是 χ2 本身,因此我们认为它们不应互换使用。